import pandas as pd
import matplotlib.pyplot as plt
# 读数据
df = pd.read_csv ("../week13_flask/data/hurun_unicorn.tsv", encoding = "utf8", sep="\t")
df_zg = df[ df.国家.str.contains("中国")]
df_zg_20 = df_zg.sort_values('估值（亿人民币）',ascending=False)[0:20]
df_mg = df[ df.国家.str.contains("美国")]
df_mg_20 = df_mg.sort_values('估值（亿人民币）',ascending=False)[0:20]


def 中国城市企业详情(city):
    cs = city
    df_cs = df_zg[df_zg.城市.str.contains(city)]
    中国城市_企业详情 = df_cs.groupby(['城市','行业']).agg({"企业名称":["count"],"估值（亿人民币）":["max"]}).reset_index().rename(columns={'企业名称':'对应行业数量','估值（亿人民币）':'对应行业最大估值（亿人民币）'})
    return 中国城市_企业详情


# 美国城市企业详情
def 美国城市企业详情(city):
    cs = city
    df_cs = df_mg[df_mg.城市.str.contains(city)]
    美国城市_企业详情 = df_cs.groupby(['城市','行业']).agg({"企业名称":["count"],"估值（亿人民币）":["max"]}).reset_index().rename(columns={'企业名称':'对应行业数量','估值（亿人民币）':'对应行业最大估值（亿人民币）'})
    return 美国城市_企业详情



city = '城市'
def 中国城市企行业数量(city):
    中国城市_list = df_zg.groupby(city)['行业'].unique().index.tolist()
    中国城市_行业 = df_zg.groupby(city)['行业'].unique().tolist()
    中国城市_行业数量_list = []
    for i in 中国城市_行业:
        a = str(len(i))
        中国城市_行业数量_list.append(a)

    中国城市_行业数量_list = list(map(int, 中国城市_行业数量_list))
    中国城市_企业 = df_zg.groupby('城市')['企业名称'].unique().tolist()
    print(中国城市_企业)
    中国城市_企业数量_list = []
    for j in 中国城市_企业:
        b = str(len(j))
        中国城市_企业数量_list.append(b)

    中国城市_企业数量 = list(map(int, 中国城市_企业数量_list))
    dict_中国城市_行业数量 = dict(zip(中国城市_list,中国城市_行业数量_list))
    df_中国城市_行业数量 = pd.DataFrame([dict_中国城市_行业数量]).T

    df_中国城市_行业数量['企业数量'] = 中国城市_企业数量_list
    df_中国城市_行业企业数量 = df_中国城市_行业数量
    df_中国城市_行业企业数量.columns = ['行业数量','企业数量']
    result = df_中国城市_行业企业数量
    return result